Etiquetage grammatical de l'arabe voyelle ou non

نویسندگان

  • Fathi Debili
  • Emna Soussi
چکیده

R6sum6 Nous abordons le probl~me de l'~tiquetage grammatical de l'arabe en reprermnt les m~thodes couramment utilis~es, lesquelles sont fond6zs sur des r~gles de succession de deux ou trois ~tiquettes grammaticales. Nous montrons que l'on ne peut pas reprendre tels quels les algorithmes pr~onis6s pour le francais ou pour l'anglais, la raison ~tant que l'arabe pose deux probl6mes : l'absence des voyelles et l'agglutination des enclinomdnes dont les segmentations potentielles induisent une combinatoire qui conduit fi r&~crire partiellement ces algorithmes. Les r6sultats obtenus pour l'arabe voyell6 sont comparables tt ce clue l'on obtient pour le francais ou pour l'anglais. Pour l'arabe non voyell6 par contre, les performances chutent assez sensiblement. L'explication r6side pr6cis6ment dams l'absence des voyellations et l'agglutination qui conduisent ~ une surmultiplication de l'ambiguRd granmmticale de ddpart. Pour amdliorer ccs rdsultats nous ddfinissons un nouveau jeu d'dtiquettes grammaticales qui amine fi une diminution de l'ambiguit~ de ddpart et~ un dlargisscment de la portde des r~gles de succession. Ces dtiqucttcs sont assocides aux formes nonrninimales de l'arabc telles clue rcncontrdes dams les tcxtes. II y a dams cc cas amelioration sensible, les rdsultats atteignant des sculls de rdsolution de 97% pour le voyclld et de 91% pour le non voyelld.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Modèles de Markov cachés pour l'estimation de plusieurs fréquences fondamentales

Le suivi de la fréquence fondamentale est un problème important du traitement de la parole et de la musique, et le développement d’algorithmes robustes pour la détermination d’une ou plusieurs fréquences fondamentales est un sujet actif de recherches en traitement du signal acoustique (Gold et Morgan, 1999). La plupart des algorithmes d’extraction de la fréquence fondamentale commencent par con...

متن کامل

بایسته‌های رضایت و برائت و تأثیر آن بر سقوط مسؤولیت پزشکی

La recherche du consentement du patient est un ancien principe, à la fois juridique et éthique, qui se fonde sur le principe du respect de l’intégrité corporelle du patient. Le respect de cette exigence par le corps médical a varié au cours des temps, comme l’illustre l’évolution récente. Le consentement du patient ou de ...

متن کامل

Elan vital chez Bergson

La Philosphie de Bergson vise la vie spirituelle, le spiritualisme, la joie, l’appétit et le changement perpétuel de la réalité. En conséquence las trios notions de la durée, de la mémoire et de l’élan vital constituent la réalité de la vie dans son cheminement et dans son progrès. L’ensemble de ces notions fondamentales décèle la contenu de la vie, et dégage la réalité de ses rigidités de l’au...

متن کامل

Voyellation automatique de l'arabe

We tackle the problem of automatic, or at least assisted, voc..aliT~tiorl, a problem that arises from the almost universal absence of vowels in Arabic texts. We show that the problem of vocalization resides in the fact that the majority of Arabic words accept several potential vocalizations and are therefore ambiguous. In essence, the problem reduces to choosing, in context, the correct vocaliz...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 1998